大家好,前面已經用了大量的時間來介紹基礎的知識,也包含一些tensorflow的基本語法,不過到了中間的幾天都在卷積神經網路,讓我覺得好像有些離題,既然已經了解了許多知識,也應該要開始進行一些練習,所以接下來就要進入到機器學習常見的問題,藉由實際操作來讓自己學習,要先認識的是迴歸問題,主題是房價預測。
首先要使用的資料集是從Kaggle上下載,Kaggle是資料建模與分析競賽平台,企業和學者可在其上發布資料集或舉辦競賽,而平台上提供開源資料集可以下載,其中有著已經整理乾淨的資料集,對初學者來說是優秀的練習素材。這次房價預測模型要使用的資料集是「House Sales in King Country, USA」,在下載並解壓縮後就可以看到一個csv檔,檔案中共有21613筆房屋資料,而每筆資料有21個不同的資訊,其中包括房屋坪數、層數、環境、屋齡等等,要做的就是透過對這些資料進行分析,建立並訓練出能輸出預測房價的模型。
今天先做一個初步介紹,明天開始就進入資料集的處理與模型的建立。
參考書籍:輕鬆學會Google TensorFlow 2.0人工智慧深度學習實作開發